<html>
 <head>
  <meta charset="utf-8"/>
  <meta content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no" name="viewport"/>
  <title>
   QiuYixuan: 统计词话（一）  | 数螺 | NAUT IDEA
  </title>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap-theme.min.css" rel="stylesheet"/>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap.min.css" rel="stylesheet"/>
  <style type="text/css">
   #xmain img {
                  max-width: 100%;
                  display: block;
                  margin-top: 10px;
                  margin-bottom: 10px;
                }

                #xmain p {
                    line-height:150%;
                    font-size: 16px;
                    margin-top: 20px;
                }

                #xmain h2 {
                    font-size: 24px;
                }

                #xmain h3 {
                    font-size: 20px;
                }

                #xmain h4 {
                    font-size: 18px;
                }


                .header {
	           background-color: #0099ff;
	           color: #ffffff;
	           margin-bottom: 20px;
	        }

	        .header p {
                  margin: 0px;
                  padding: 10px 0;
                  display: inline-block;  
                  vertical-align: middle;
                  font-size: 16px;
               }

               .header a {
                 color: white;
               }

              .header img {
                 height: 25px;
              }
  </style>
  <script src="http://cdn.bootcss.com/jquery/3.0.0/jquery.min.js">
  </script>
  <script src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML" type="text/javascript">
   MathJax.Hub.Config({
          tex2jax: {inlineMath: [['$','$'], ['\\(','\\)']]},
          TeX: {equationNumbers: {autoNumber: "AMS"}}
        });
  </script>
  <script src="http://nautstatic-10007657.file.myqcloud.com/static/css/readability.min.js" type="text/javascript">
  </script>
  <script type="text/javascript">
   $(document).ready(function() {
                 var loc = document.location;
                 var uri = {
                  spec: "http://cos.name/2011/03/statistics-in-chinese-song-poem-1/",
                  host: "http://cos.name",
                  prePath: "http://cos.name",
                  scheme: "http",
                  pathBase: "http://cos.name/"
                 };
    
                 var documentClone = document.cloneNode(true);
                 var article = new Readability(uri, documentClone).parse();
     
                 document.getElementById("xmain").innerHTML = article.content;
                });
  </script>
  <!-- 1466437291: Accept with keywords: (title(0.2):词话,中国,服务平台,门户网站,统计学, topn(0.3):频数,阑干,诗词,统计学,R语言,数据挖掘,词人,词频,用词,内容,排序,数据,句子,中国人民大学,词语,格式,文章,学院,服务平台,分词,风月,字符,门户网站,程序,论坛,东风,评论,词牌,词话,文本).-->
 </head>
 <body class="single single-post postid-3194 single-format-standard sidebar" onload="">
  <div class="header">
   <div class="container">
    <div class="row">
     <div class="col-xs-6 col-sm-6 text-left">
      <a href="/databee">
       <img src="http://nautidea-10007657.cos.myqcloud.com/logo_white.png"/>
      </a>
      <a href="/databee">
       <p>
        数螺
       </p>
      </a>
     </div>
     <div class="hidden-xs col-sm-6 text-right">
      <p>
       致力于数据科学的推广和知识传播
      </p>
     </div>
    </div>
   </div>
  </div>
  <div class="container text-center">
   <h1>
    QiuYixuan: 统计词话（一）
   </h1>
  </div>
  <div class="container" id="xmain">
   <div class="hfeed site" id="page">
    <header class="site-header" id="masthead" role="banner">
     <div id="cos-logo">
      <a href="http://cos.name/">
       <img src="http://cos.name/wp-content/themes/COS-kermesinus/images/headers/cos-logo.png"/>
      </a>
     </div>
     <div class="navbar" id="navbar">
      <nav class="navigation main-navigation" id="site-navigation" role="navigation">
       <h3 class="menu-toggle">
        菜单
       </h3>
       <a class="screen-reader-text skip-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#content" title="跳至内容">
        跳至内容
       </a>
       <div class="menu-%e6%88%91%e7%9a%84%e8%8f%9c%e5%8d%95-container">
        <ul class="nav-menu" id="menu-%e6%88%91%e7%9a%84%e8%8f%9c%e5%8d%95">
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-home menu-item-4746" id="menu-item-4746">
          <a href="http://cos.name">
           主页
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-has-children menu-item-8120" id="menu-item-8120">
          <a href="http://cos.name/cn">
           论坛
          </a>
          <ul class="sub-menu">
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8124" id="menu-item-8124">
            <a href="http://cos.name/cn/wp-login.php?action=register">
             论坛注册
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8125" id="menu-item-8125">
            <a href="http://cos.name/cn/wp-login.php">
             论坛登录
            </a>
           </li>
          </ul>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8110" id="menu-item-8110">
          <a href="http://cos.name/books/">
           图书资料
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8112" id="menu-item-8112">
          <a href="http://cos.name/videos">
           视频教程
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8333" id="menu-item-8333">
          <a href="http://cos.name/salon/">
           统计沙龙
          </a>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8111" id="menu-item-8111">
          <a href="http://cos.name/chinar/">
           R语言会议
          </a>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8109" id="menu-item-8109">
          <a href="http://cos.name/training/">
           讲座与培训
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8115" id="menu-item-8115">
          <a href="http://cos.name/cn/forum/comprehensive/job/">
           招聘信息
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-has-children menu-item-4780" id="menu-item-4780">
          <a href="http://cos.name/about">
           关于我们
          </a>
          <ul class="sub-menu">
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8113" id="menu-item-8113">
            <a href="http://cos.name/2008/11/how-to-work-with-cos/">
             加入我们
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8119" id="menu-item-8119">
            <a href="http://cos.name/donate/">
             赞助我们
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8114" id="menu-item-8114">
            <a href="http://cos.name/cn/forum/26">
             项目合作
            </a>
           </li>
          </ul>
         </li>
        </ul>
       </div>
       <form action="http://cos.name/" class="search-form" method="get" role="search">
        <label>
         <span class="screen-reader-text">
          搜索：
         </span>
        </label>
       </form>
      </nav>
      <!-- #site-navigation -->
     </div>
     <!-- #navbar -->
    </header>
    <!-- #masthead -->
    <div class="site-main" id="main">
     <div class="content-area" id="primary">
      <div class="site-content" id="content" role="main">
       <article class="post-3194 post type-post status-publish format-standard hentry category-data category-dmml tag-423 tag-419 tag-421 tag-420 tag-422" id="post-3194">
        <header class="entry-header">
         <h1 class="entry-title">
          统计词话（一）
         </h1>
         <div class="entry-meta">
          <span class="date">
           <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/" rel="bookmark" title="链向统计词话（一）的固定链接">
            <time class="entry-date" datetime="2011-03-04T22:05:29+00:00">
             2011/03/04
            </time>
           </a>
          </span>
          <span class="categories-links">
           <a href="http://cos.name/category/data/" rel="category tag">
            数据分析
           </a>
           、
           <a href="http://cos.name/category/data/dmml/" rel="category tag">
            数据挖掘与机器学习
           </a>
          </span>
          <span class="tags-links">
           <a href="http://cos.name/tag/%e5%88%86%e8%af%8d/" rel="tag">
            分词
           </a>
           、
           <a href="http://cos.name/tag/%e5%ae%8b%e8%af%8d/" rel="tag">
            宋词
           </a>
           、
           <a href="http://cos.name/tag/%e6%96%87%e6%9c%ac%e6%8c%96%e6%8e%98/" rel="tag">
            文本挖掘
           </a>
           、
           <a href="http://cos.name/tag/%e8%af%8d%e9%a2%91/" rel="tag">
            词频
           </a>
           、
           <a href="http://cos.name/tag/%e9%a2%91%e7%8e%87/" rel="tag">
            频率
           </a>
          </span>
          <span class="author vcard">
           <a class="url fn n" href="http://cos.name/author/yixuanq/" rel="author" title="查看所有由邱怡轩发布的文章">
            邱怡轩
           </a>
          </span>
         </div>
         <!-- .entry-meta -->
        </header>
        <!-- .entry-header -->
        <div class="entry-content">
         <p style="text-align: center;">
          <img src="http://cos.name/wp-content/uploads/2011/03/image-500x361.jpg"/>
         </p>
         <p>
          不知道这个标题是否有足够的吸引力把你骗进来。如果你认为统计是一个到处充满了期望方差分布回归随机多元和概率的东西，那么……你可能是对的，不过本文想要告诉你的是，你其实还可以用统计来做一些你关心的事情，比如现在，我们既谈风月，也谈统计。:D
         </p>
         <p>
          相信大家对宋词都不会陌生。无论你是否喜欢，总还是可以吟诵出几句名篇来的。如果你经常找一些宋词来读的话，你可能会发现一个有趣的现象，那就是有些词语或意象似乎特别受到词人的青睐，像是东风，明月，芳草等等。当然，对于这个现象，不同的人有不同的看法。一种观点是这些意象往往具有特定的含义，或是抒发离恨，或是寄托相思，总之是把人们的情感倾注在了这些最常见的事物之中，让人触景生情；而另一种看法则觉得词的雕琢痕迹太明显，内容也相对单调，使得用词容易造成重复。本文当然不是来探讨这些话题的，而是想用统计的方法来给大家展示一下究竟有哪些话语被词人一次一次地书写，被读者一遍一遍地传唱。
         </p>
         <p>
          从统计的角度来看，上面这个问题其实非常简单，无非就是计算一下宋词之中词语出现的频率，然后做一个排序就可以了。但这个问题对于中文来说恰恰是最难攻克的一个环节。在英语中，词语与词语之间有着天然的分隔符，但对于中文，只有句子之间有标点符号，句子之内只能通过词语的含义来进行辨别。这也就是为什么在文本挖掘领域中，中文的分词依然是一个富有挑战性的任务的原因。
         </p>
         <p>
          不过好在宋词本身的形式帮了我们很大的忙。首先，宋词的句子一般都非常短，这相当于已经有了一次粗略的词语划分；其次，宋词的用词也很简洁，一个词一般是两个字，偶尔可能有三个字、四个字，超过四个字的词就非常罕见了。于是我们就有一种比较“野蛮”的做法，来对宋词中的用词进行划分。
         </p>
         <p>
          举个例子来说，《青玉案》中的这句“东风夜放花千树”，如果把所有可能的两个字的组合列出来，就是：
         </p>
         <blockquote>
          <p>
           东风  风夜  夜放  放花  花千  千树
          </p>
         </blockquote>
         <p>
          如果再把三个字的可能组合列出来，则有：
         </p>
         <blockquote>
          <p>
           东风夜  风夜放  夜放花  放花千  花千树
          </p>
         </blockquote>
         <p>
          如果不考虑其它的可能，那么总共就有11个词语。当然，这其中会有很多无意义的组合，但是我们可以预想的是，这些无意义的组合将不太可能大规模地重复出现，因此在排序的过程中它们自动地就被排在高频词语之后了。通过这种做法，宋词中的每句话大体都能分成10个左右的词语单位，然后对所有的这些词语单位进行频数统计，就可以得到最终的高频词语列表了。
         </p>
         <p>
          下面就通过一段R程序来进行一次实际的分析，用到的数据是从网络上整理的《全宋词》电子资料，其中可能有部分字词不正确。完整的程序和数据可以从
          <a href="http://cos.name/wp-content/uploads/2011/03/SongPoem.tar.gz" target="_blank">
           这里下载
          </a>
          。
         </p>
         <p>
          首先，当然是读取数据。
         </p>
         <pre class="brush: r">txt=read.csv("SongPoem.csv",colClasses="character");</pre>
         <p>
          接下来提取出宋词的内容，并根据标点符号对句子进行分割。
         </p>
         <pre class="brush: r">sentences=strsplit(txt$Sentence,"，|。|！|？|、");
sentences=unlist(sentences);
sentences=sentences[sentences!=""];</pre>
         <p>
          对句子进行分割后需要检查一遍，如果有些句子的长度超过了15个字，那么很可能是错误的字符，应该剔除掉。
         </p>
         <pre class="brush: r">s.len=nchar(sentences);
sentences=sentences[s.len&lt;=15];
s.len=nchar(sentences);</pre>
         <p>
          下面的这个函数非常重要，其作用就是按照之前的做法把所有可能的字的组合计算出来。这里只是考虑了两个字的组合。
         </p>
         <pre class="brush: r">splitwords=function(x,x.len) substring(x,1:(x.len-1),2:x.len);</pre>
         <p>
          接下来就好办了，无非就是应用上面的函数对句子进行拆分，然后统计词频并排序。
         </p>
         <pre class="brush: r">words=mapply(splitwords,sentences,s.len,SIMPLIFY=TRUE,USE.NAMES=FALSE);
words=unlist(words);
words.freq=table(words);
words.freq=sort(words.freq,decreasing=TRUE);
words.freq[1:100];</pre>
         <p>
          最后的结果如下：
         </p>
         <pre>排序  词语    频数          排序  词语    频数
1     □□     1584         51    匆匆    357
2     东风    1379         52    芙蓉    356
3     何处    1231         53    今日    354
4     人间    1164         54    扁舟    351
5     风流    843          55    西湖    350
6     归去    818          56    憔瘁    349
7     春风    800          57    消息    347
8     西风    782          58    桃花    343
9     归来    768          59    何事    335
10    江南    760          60    一片    333
11    相思    759          61    神仙    332
12    梅花    725          62    一声    331
13    千里    668          63    黄花    330
14    多少    653          64    心事    330
15    回首    649          65    鸳鸯    328
16    如今    647          66    十分    327
17    明月    646          67    人生    324
18    阑干    632          68    断肠    323
19    年年    605          69    佳人    323
20    万里    587          70    长安    321     
21    一笑    579          71    东君    319     
22    黄昏    561          72    桃李    319     
23    当年    537          73    而今    318     
24    芳草    533          74    为谁    317     
25    天涯    531          75    无情    307     
26    相逢    523          76    去年    306     
27    尊前    519          77    天气    306     
28    一枝    510          78    不是    305     
29    风雨    500          79    海棠    305     
30    流水    481          80    少年    305     
31    风吹    474          81    今夜    304     
32    依旧    469          82    不似    303     
33    多情    458          83    十年    303     
34    风月    452          84    行人    300     
35    当时    451          85    谁知    300     
36    故人    445          86    寂寞    299     
37    斜阳    444          87    肠断    297     
38    无人    443          88    江上    297     
39    不知    426          89    悠悠    297     
40    深处    424          90    富贵    295     
41    不见    416          91    时候    295     
42    时节    407          92    昨夜    295     
43    凄凉    404          93    几度    292     
44    平生    394          94    月明    292     
45    春色    393          95    何时    291     
46    无限    381          96    青山    291     
47    一点    374          97    蓬莱    290     
48    功名    366          98    往事    290     
49    杨柳    363          99    如何    287     
50    天上    361          100   惟有    287</pre>
         <p>
          需要解释一下的是，排在第一位的方框是词库中的一些出错的字符，直接略去即可。
         </p>
         <p>
          至此，真相大白。至于这个结果意味着什么，就留给读者自己细细品读吧。
         </p>
         <div class="wumii-hook">
          <br/>
          <br/>
         </div>
        </div>
        <!-- .entry-content -->
        <footer class="entry-meta">
         <div class="author-info">
          <div class="author-avatar">
           <img src="http://sdn.geekzu.org/avatar/f09663fd5fc04bad5e5b09daddb86fe6?s=74&amp;d=monsterid&amp;r=g"/>
          </div>
          <!-- .author-avatar -->
          <div class="author-description">
           <h2 class="author-title">
            关于邱怡轩
           </h2>
           <p class="author-bio">
            中国人民大学统计学院硕士，普渡（
            <del>
             众生
            </del>
            ）大学博士研究僧
            <a class="author-link" href="http://cos.name/author/yixuanq/" rel="author">
             查看所有由邱怡轩发表的文章
             <span class="meta-nav">
              →
             </span>
            </a>
           </p>
          </div>
          <!-- .author-description -->
         </div>
         <!-- .author-info -->
        </footer>
        <!-- .entry-meta -->
       </article>
       <!-- #post -->
       <nav class="navigation post-navigation" role="navigation">
        <h1 class="screen-reader-text">
         文章导航
        </h1>
        <div class="nav-links">
         <a href="http://cos.name/2011/02/an-tutorial-of-package-actuar/" rel="prev">
          <span class="meta-nav">
           ←
          </span>
          用R也能做精算——actuar包学习笔记（三）
         </a>
         <a href="http://cos.name/2011/03/1st-data-mining-competetion-for-college-students/" rel="next">
          通知：首届全国大学生数据挖掘邀请赛
          <span class="meta-nav">
           →
          </span>
         </a>
        </div>
        <!-- .nav-links -->
       </nav>
       <!-- .navigation -->
       <div class="comments-area" id="comments">
        <h2 class="comments-title">
         《
         <span>
          统计词话（一）
         </span>
         》有40个想法
        </h2>
        <ol class="comment-list">
         <li class="comment even thread-even depth-1 parent" id="comment-1905">
          <article class="comment-body" id="div-comment-1905">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/8cb194b6376f032f0da99caef73a6f94?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://saslist.com/hssnow/" rel="external nofollow">
               hssnow
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1905">
              <time datetime="2011-03-04T22:36:57+00:00">
               2011/03/04 22:36
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             呵呵，期待下集
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给hssnow" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1905#respond" onclick='return addComment.moveForm( "div-comment-1905", "1905", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment odd alt depth-2 parent" id="comment-1906">
            <article class="comment-body" id="div-comment-1906">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/ab099078a99ff873d530a680044e79e0?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                qiushi
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1906">
                <time datetime="2011-03-04T23:00:45+00:00">
                 2011/03/04 23:00
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               说明宋代文人喜欢抽风，问路和怀旧，数学也不好
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给qiushi" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1906#respond" onclick='return addComment.moveForm( "div-comment-1906", "1906", "respond", "3194" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment byuser comment-author-yixuanq bypostauthor even depth-3" id="comment-1908">
              <article class="comment-body" id="div-comment-1908">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/f09663fd5fc04bad5e5b09daddb86fe6?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  邱怡轩
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1908">
                  <time datetime="2011-03-04T23:34:27+00:00">
                   2011/03/04 23:34
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 何出此言啊，呵呵。恐怕“后之视今，亦犹今之视昔”啊。:-)
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment byuser comment-author-yihui odd alt depth-3" id="comment-1910">
              <article class="comment-body" id="div-comment-1910">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/1022d8e6ebc94e8f6bca9a86cebe312a?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://yihui.name" rel="external nofollow">
                   谢益辉
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1910">
                  <time datetime="2011-03-05T01:01:18+00:00">
                   2011/03/05 01:01
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 有抽风问路怀旧，这数学不好是从哪儿看出来的？数数只能从一数到十？一笑一枝一点一片十分十年……
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1" id="comment-1907">
          <article class="comment-body" id="div-comment-1907">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/297f5a15b15792a065a95b56eba60243?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              波波头一头
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1907">
              <time datetime="2011-03-04T23:21:53+00:00">
               2011/03/04 23:21
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             好棒~~~
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给波波头一头" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1907#respond" onclick='return addComment.moveForm( "div-comment-1907", "1907", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1" id="comment-1909">
          <article class="comment-body" id="div-comment-1909">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/7eb1cd59414840b6df59cab73090dbc9?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              G_will
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1909">
              <time datetime="2011-03-04T23:35:32+00:00">
               2011/03/04 23:35
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             Cool!
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给G_will" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1909#respond" onclick='return addComment.moveForm( "div-comment-1909", "1909", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment byuser comment-author-taiyun even thread-odd thread-alt depth-1" id="comment-1912">
          <article class="comment-body" id="div-comment-1912">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/beb15ba775be6241a4e5fc9e476e36c0?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://taiyun.cos.name/" rel="external nofollow">
               魏太云
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1912">
              <time datetime="2011-03-05T10:22:50+00:00">
               2011/03/05 10:22
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             重剑无锋，大巧不工；此文之谓也。
            </p>
            <p>
             以后喝酒应该让每人根据抽中的高频意境吟诵相应的词句，背不出来则罚酒。
            </p>
            <p>
             文章名字起得极好，贴切传神又兼具文学味道和统计味道，陶醉+拜服~~~
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给魏太云" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1912#respond" onclick='return addComment.moveForm( "div-comment-1912", "1912", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1 parent" id="comment-1913">
          <article class="comment-body" id="div-comment-1913">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/e787625af13288963c5a63bd2a4e5e82?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://gaotao.name/cn" rel="external nofollow">
               gaotao
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1913">
              <time datetime="2011-03-05T10:53:13+00:00">
               2011/03/05 10:53
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             随意一扫,竟发现横着连读也不错(31开始):
            </p>
            <p>
             风吹今夜依旧
             <br/>
             不似多情
             <br/>
             十年风月
             <br/>
             行人当时谁知
             <br/>
             故人寂寞
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给gaotao" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1913#respond" onclick='return addComment.moveForm( "div-comment-1913", "1913", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-yihui even depth-2 parent" id="comment-1915">
            <article class="comment-body" id="div-comment-1915">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/1022d8e6ebc94e8f6bca9a86cebe312a?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                <a class="url" href="http://yihui.name" rel="external nofollow">
                 谢益辉
                </a>
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1915">
                <time datetime="2011-03-05T13:37:58+00:00">
                 2011/03/05 13:37
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               是不是随机抽样任意组合都很可能成为一首词？宋词和政治题、思想汇报似乎有某种相似性啊 😀
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给谢益辉" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1915#respond" onclick='return addComment.moveForm( "div-comment-1915", "1915", "respond", "3194" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment odd alt depth-3" id="comment-1921">
              <article class="comment-body" id="div-comment-1921">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/e787625af13288963c5a63bd2a4e5e82?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://gaotao.name/cn" rel="external nofollow">
                   gaotao
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1921">
                  <time datetime="2011-03-05T19:29:13+00:00">
                   2011/03/05 19:29
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 虽然词的格律要求严格,但随机抽样任意组合产词估计还是行,不过品味高的肯定少了.
                 <br/>
                 灵光乍现,想我这种不会作词的人,拿着这个词料库让电脑自己按一个词牌往里面填,说不定都可以成为一个”伪词人”.:)
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
           <li class="comment byuser comment-author-yixuanq bypostauthor even depth-2 parent" id="comment-1922">
            <article class="comment-body" id="div-comment-1922">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/f09663fd5fc04bad5e5b09daddb86fe6?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                邱怡轩
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1922">
                <time datetime="2011-03-05T21:49:56+00:00">
                 2011/03/05 21:49
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               看这个：
               <a href="http://www.jos.org.cn/ch/reader/create_pdf.aspx?file_no=3596&amp;flag=&amp;journal_id=jos" rel="nofollow">
                一种宋词自动生成的遗传算法及其机器实现
               </a>
               。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给邱怡轩" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1922#respond" onclick='return addComment.moveForm( "div-comment-1922", "1922", "respond", "3194" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment odd alt depth-3" id="comment-1923">
              <article class="comment-body" id="div-comment-1923">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/e787625af13288963c5a63bd2a4e5e82?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://gaotao.name/cn" rel="external nofollow">
                   gaotao
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1923">
                  <time datetime="2011-03-05T22:30:37+00:00">
                   2011/03/05 22:30
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 哈哈, 我当时就正在想可以按辛弃疾的来填词呢..
                 <br/>
                 原来现在以前国外的诗歌自动生成现在在中国的各种古典文化也有少进展了..
                 <br/>
                 宋词应该算好做的…诗就难写了, 文言文就更那个了…
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment byuser comment-author-yihui even depth-3" id="comment-1924">
              <article class="comment-body" id="div-comment-1924">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/1022d8e6ebc94e8f6bca9a86cebe312a?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://yihui.name" rel="external nofollow">
                   谢益辉
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1924">
                  <time datetime="2011-03-06T02:36:31+00:00">
                   2011/03/06 02:36
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 “希望我们的研究，能够弥补我国在诗歌自动生成学术性研究方面的不足”——这种东西开开玩笑还可以，真的当学术研究我怎么想怎么觉得没谱……已经有的诗词都读不完了，不知道有谁会去读自动生成的诗词。不管自动生成的诗词如何漂亮通顺，它们都没有特定的意境和人的情感。
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment byuser comment-author-dengyishuo odd alt thread-odd thread-alt depth-1" id="comment-1914">
          <article class="comment-body" id="div-comment-1914">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/7969a4509f4093e8637e6bf70f3f7fc1?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://yishuo.cos.name" rel="external nofollow">
               邓一硕
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1914">
              <time datetime="2011-03-05T12:56:39+00:00">
               2011/03/05 12:56
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             你可以用这个程序分析一下范仲淹和辛弃疾词的区别，或者分析一下婉约派和豪放派词的不同之处。也许是更近一步。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给邓一硕" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1914#respond" onclick='return addComment.moveForm( "div-comment-1914", "1914", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-even depth-1 parent" id="comment-1916">
          <article class="comment-body" id="div-comment-1916">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/db388ef42ecd962a47809e62c9f0f873?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              RaielZ
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1916">
              <time datetime="2011-03-05T14:09:23+00:00">
               2011/03/05 14:09
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             好多風,各種風
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给RaielZ" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1916#respond" onclick='return addComment.moveForm( "div-comment-1916", "1916", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-yihui odd alt depth-2 parent" id="comment-1918">
            <article class="comment-body" id="div-comment-1918">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/1022d8e6ebc94e8f6bca9a86cebe312a?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                <a class="url" href="http://yihui.name" rel="external nofollow">
                 谢益辉
                </a>
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1918">
                <time datetime="2011-03-05T14:31:58+00:00">
                 2011/03/05 14:31
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               方向上来说，好像没有北风、西风、南风，只有东风。我怎么想起麻将来了，东西南北中发白……
              </p>
              <p>
               这“古道西风瘦马”可能是看前人总是打东风都腻了才打出西风来的，还是各朝代的气象条件不一样？……
              </p>
              <p>
               话说回来为啥从没听说过什么诗词里出现过南风呢？夏天诗人们都干啥去了？
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给谢益辉" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1918#respond" onclick='return addComment.moveForm( "div-comment-1918", "1918", "respond", "3194" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment even depth-3" id="comment-1919">
              <article class="comment-body" id="div-comment-1919">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/db388ef42ecd962a47809e62c9f0f873?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  RaielZ
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1919">
                  <time datetime="2011-03-05T14:46:29+00:00">
                   2011/03/05 14:46
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 那個那個，西風有排第八的（or 7th）。。
                 <br/>
                 南風是真的沒什麽印象。可能南風在天熱刮得多，基本沒被察覺到。
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment odd alt depth-3" id="comment-1928">
              <article class="comment-body" id="div-comment-1928">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/31fab48d36a171fe72b63bb22ef7ef62?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://www.leejian.name/" rel="external nofollow">
                   lijian
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1928">
                  <time datetime="2011-03-07T10:43:24+00:00">
                   2011/03/07 10:43
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 主要是春愁是一个很广泛的主题，东风就多。西风也不少，不过估计被金风分掉了一些。北风放在词里就有点俗了，诗里面会被朔风分走一些。南风的隐喻相对差些，早些的南风不竞是死声，而且有南面称孤一说，对着老板吹的风还是少些为妙，自然的南方时节也不大合适写词，吹到南风后多半要写“一点浩然气千里快哉风”之类的句子
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment byuser comment-author-yihui even thread-odd thread-alt depth-1 parent" id="comment-1917">
          <article class="comment-body" id="div-comment-1917">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/1022d8e6ebc94e8f6bca9a86cebe312a?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://yihui.name" rel="external nofollow">
               谢益辉
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1917">
              <time datetime="2011-03-05T14:24:24+00:00">
               2011/03/05 14:24
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             这些口口字符有可能是在GB2312编码下显示不出来，比如《殢人娇》的第一个字。貌似贺铸和无名氏的口口最多。我不知道原始数据是什么编码以及UTF8是不是会好一些。
            </p>
            <p>
             这数据还有一个小问题，Title和Title2基本上相同，要么就是Title2为空，此时往往是上一首词不完整，最后一句挪到了下一行。
            </p>
            <p>
             数据再进一步量化一下，也许能做出一篇不错的论文。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给谢益辉" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1917#respond" onclick='return addComment.moveForm( "div-comment-1917", "1917", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-yixuanq bypostauthor odd alt depth-2" id="comment-1920">
            <article class="comment-body" id="div-comment-1920">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/f09663fd5fc04bad5e5b09daddb86fe6?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                邱怡轩
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1920">
                <time datetime="2011-03-05T15:25:40+00:00">
                 2011/03/05 15:25
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               忘了说了，这个csv是我整理后的结果，title是词牌名，title2是词牌正名，因为不知道怎么翻译所以就干脆title和title2了。有的词牌内容丢失了，就标注为“失调名”，这时候词牌正名就是空的，而词的内容也往往不完整。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给邱怡轩" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1920#respond" onclick='return addComment.moveForm( "div-comment-1920", "1920", "respond", "3194" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
           <li class="comment even depth-2" id="comment-1926">
            <article class="comment-body" id="div-comment-1926">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/31fab48d36a171fe72b63bb22ef7ef62?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                <a class="url" href="http://www.leejian.name/" rel="external nofollow">
                 lijian
                </a>
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1926">
                <time datetime="2011-03-07T10:23:25+00:00">
                 2011/03/07 10:23
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               那个应该是本来就缺失的，现在大家用的全宋词应该都是同一个版本
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给lijian" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1926#respond" onclick='return addComment.moveForm( "div-comment-1926", "1926", "respond", "3194" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1" id="comment-1925">
          <article class="comment-body" id="div-comment-1925">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/abd82db6fc93f4ed3c5ae292f4d8f0c7?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://jiangtanghu.com" rel="external nofollow">
               胡江堂
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1925">
              <time datetime="2011-03-06T22:02:00+00:00">
               2011/03/06 22:02
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             这篇给我们博客带来不少清新之风啊。关于南风，《诗经》里有“凯风南来”，不过直接拿这两个字入诗的还真不多。又，以前叫填词，对着曲谱，一个萝卜对应一个坑，有时候为了适应格式，出来的东西，真跟自动生成的一样。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给胡江堂" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1925#respond" onclick='return addComment.moveForm( "div-comment-1925", "1925", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1" id="comment-1927">
          <article class="comment-body" id="div-comment-1927">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/31fab48d36a171fe72b63bb22ef7ef62?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://www.leejian.name/" rel="external nofollow">
               lijian
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1927">
              <time datetime="2011-03-07T10:29:33+00:00">
               2011/03/07 10:29
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             不错不错，不知分词后结果会不会变。我一直想用R做一个集句词的工具，还想弄个古诗词分词的，不过一直没开始做。有空可以一起研究一下，哈哈。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给lijian" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1927#respond" onclick='return addComment.moveForm( "div-comment-1927", "1927", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1 parent" id="comment-1942">
          <article class="comment-body" id="div-comment-1942">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/b706f149d7d08b88e1534594adab8ea5?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://yixf.name" rel="external nofollow">
               yixf
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1942">
              <time datetime="2011-03-21T10:29:49+00:00">
               2011/03/21 10:29
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             受你的启发，我对《全唐诗》和《全宋词》进行了一个“更加全面”的统计，并进行了简单的比较分析。
             <br/>
             详见：
             <a href="http://yixf.name/2011/03/21/%E5%B1%B1%E4%BA%BA%E4%BD%95%E5%A4%84%E5%90%9B%E4%B8%8D%E8%A7%81%EF%BC%9F%E4%B8%9C%E9%A3%8E%E4%B8%80%E8%8A%B1%E5%80%9A%E9%98%91%E5%B9%B2%EF%BC%81-%E2%80%94%E2%80%94%E3%80%8A%E5%85%A8%E5%94%90%E8%AF%97/" rel="nofollow">
              山人何处君不见？东风一花倚阑干！ ——《全唐诗》、《全宋词》统计分析报告
             </a>
             <br/>
             R中的分词使用的是你的代码。谢谢！
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给yixf" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1942#respond" onclick='return addComment.moveForm( "div-comment-1942", "1942", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-yixuanq bypostauthor even depth-2" id="comment-1943">
            <article class="comment-body" id="div-comment-1943">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/f09663fd5fc04bad5e5b09daddb86fe6?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                邱怡轩
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1943">
                <time datetime="2011-03-21T14:39:31+00:00">
                 2011/03/21 14:39
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               很有意思，呵呵。其实最花时间的还是整理格式。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给邱怡轩" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1943#respond" onclick='return addComment.moveForm( "div-comment-1943", "1943", "respond", "3194" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
           <li class="comment odd alt depth-2 parent" id="comment-2035">
            <article class="comment-body" id="div-comment-2035">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/67f246ec8db25d00100b87f8b1bd3e9f?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                yinuo
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-2035">
                <time datetime="2011-04-30T16:17:47+00:00">
                 2011/04/30 16:17
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               所附的所有数据（原始数据、程序脚本、结果图表，等）已过期，能不能发给菜鸟一份。谢谢，邮箱yinuo9257@163.con谢谢！
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给yinuo" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=2035#respond" onclick='return addComment.moveForm( "div-comment-2035", "2035", "respond", "3194" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
            <ol class="children">
             <li class="comment even depth-3" id="comment-2036">
              <article class="comment-body" id="div-comment-2036">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/b706f149d7d08b88e1534594adab8ea5?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  <a class="url" href="http://yixf.name" rel="external nofollow">
                   yixf
                  </a>
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-2036">
                  <time datetime="2011-04-30T18:57:01+00:00">
                   2011/04/30 18:57
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 你好，实在抱歉，忘了续期了。
                 <br/>
                 现在可以下载了。http://u.115.com/file/f39c476cae
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
             <li class="comment odd alt depth-3" id="comment-2037">
              <article class="comment-body" id="div-comment-2037">
               <footer class="comment-meta">
                <div class="comment-author vcard">
                 <img src="http://sdn.geekzu.org/avatar/67f246ec8db25d00100b87f8b1bd3e9f?s=74&amp;d=monsterid&amp;r=g"/>
                 <b class="fn">
                  yinuo
                 </b>
                 <span class="says">
                  说道：
                 </span>
                </div>
                <!-- .comment-author -->
                <div class="comment-metadata">
                 <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-2037">
                  <time datetime="2011-04-30T20:24:44+00:00">
                   2011/04/30 20:24
                  </time>
                 </a>
                </div>
                <!-- .comment-metadata -->
               </footer>
               <!-- .comment-meta -->
               <div class="comment-content">
                <p>
                 谢谢！
                </p>
               </div>
               <!-- .comment-content -->
              </article>
              <!-- .comment-body -->
             </li>
             <!-- #comment-## -->
            </ol>
            <!-- .children -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1" id="comment-1952">
          <article class="comment-body" id="div-comment-1952">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/878e7eb687b3cde176796cdac1adbd63?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              谢小生
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-1952">
              <time datetime="2011-03-30T17:42:08+00:00">
               2011/03/30 17:42
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             很有意思的应用 。有空也弄弄唐诗的 。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给谢小生" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=1952#respond" onclick='return addComment.moveForm( "div-comment-1952", "1952", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1" id="comment-2086">
          <article class="comment-body" id="div-comment-2086">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/a375b44846ac68d82c949a45c24a0275?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              poemcao
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-2086">
              <time datetime="2011-05-12T11:56:47+00:00">
               2011/05/12 11:56
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             请问在用Excle整理文本数据的时候有些什么具体的格式要求呢？
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给poemcao" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=2086#respond" onclick='return addComment.moveForm( "div-comment-2086", "2086", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-odd thread-alt depth-1" id="comment-2185">
          <article class="comment-body" id="div-comment-2185">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/606a0804bc046507af12bebbfe12e7af?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://www.feime.net" rel="external nofollow">
               albertlee
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-2185">
              <time datetime="2011-05-30T20:01:45+00:00">
               2011/05/30 20:01
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             结合一些对杖和词牌的条件，就能自动写诗了。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给albertlee" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=2185#respond" onclick='return addComment.moveForm( "div-comment-2185", "2185", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="pingback odd alt thread-even depth-1" id="comment-2816">
          <div class="comment-body">
           Pingback：
           <a class="url" href="http://cos.name/2012/03/statistics-in-chinese-song-poem-2/" rel="external nofollow">
            邱怡轩: 统计词话（二） | 统计之都 (中国统计学门户网站，免费统计学服务平台)
           </a>
          </div>
         </li>
         <!-- #comment-## -->
         <li class="pingback even thread-odd thread-alt depth-1" id="comment-2846">
          <div class="comment-body">
           Pingback：
           <a class="url" href="http://www.luvegood.org/ted-and-mayuan-presentation/" rel="external nofollow">
            TED@ZJU与马原课二合一的presentation » Hope
           </a>
          </div>
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-even depth-1 parent" id="comment-3121">
          <article class="comment-body" id="div-comment-3121">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/aeea10d315b8e43bab535dfa468e083b?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              小何
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-3121">
              <time datetime="2012-06-07T13:02:35+00:00">
               2012/06/07 13:02
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             麻烦发下范例给我，菜鸟想学习下。
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给小何" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=3121#respond" onclick='return addComment.moveForm( "div-comment-3121", "3121", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
          <ol class="children">
           <li class="comment byuser comment-author-yixuanq bypostauthor even depth-2" id="comment-3122">
            <article class="comment-body" id="div-comment-3122">
             <footer class="comment-meta">
              <div class="comment-author vcard">
               <img src="http://sdn.geekzu.org/avatar/f09663fd5fc04bad5e5b09daddb86fe6?s=74&amp;d=monsterid&amp;r=g"/>
               <b class="fn">
                <a class="url" href="http://yixuan.cos.name/cn" rel="external nofollow">
                 邱怡轩
                </a>
               </b>
               <span class="says">
                说道：
               </span>
              </div>
              <!-- .comment-author -->
              <div class="comment-metadata">
               <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-3122">
                <time datetime="2012-06-07T16:53:31+00:00">
                 2012/06/07 16:53
                </time>
               </a>
              </div>
              <!-- .comment-metadata -->
             </footer>
             <!-- .comment-meta -->
             <div class="comment-content">
              <p>
               都在文章中啊。
              </p>
             </div>
             <!-- .comment-content -->
             <div class="reply">
              <a aria-label="回复给邱怡轩" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=3122#respond" onclick='return addComment.moveForm( "div-comment-3122", "3122", "respond", "3194" )' rel="nofollow">
               回复
              </a>
             </div>
            </article>
            <!-- .comment-body -->
           </li>
           <!-- #comment-## -->
          </ol>
          <!-- .children -->
         </li>
         <!-- #comment-## -->
         <li class="pingback odd alt thread-odd thread-alt depth-1" id="comment-5387">
          <div class="comment-body">
           Pingback：
           <a class="url" href="http://oldj.net/article/word-frequency-of-santi/" rel="external nofollow">
            《三体》中哪些词出现得最多？ | oldj's blog
           </a>
          </div>
         </li>
         <!-- #comment-## -->
         <li class="comment even thread-even depth-1" id="comment-6051">
          <article class="comment-body" id="div-comment-6051">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://t.qq.com/abczhoubc" rel="external nofollow">
               周宝成
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-6051">
              <time datetime="2014-07-18T17:04:20+00:00">
               2014/07/18 17:04
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             还能这样玩啊
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给周宝成" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=6051#respond" onclick='return addComment.moveForm( "div-comment-6051", "6051", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-odd thread-alt depth-1" id="comment-6561">
          <article class="comment-body" id="div-comment-6561">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://weibo.com/3032189585" rel="external nofollow">
               Stef要争气
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-6561">
              <time datetime="2015-01-31T02:08:41+00:00">
               2015/01/31 02:08
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             学习
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给Stef要争气" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=6561#respond" onclick='return addComment.moveForm( "div-comment-6561", "6561", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="pingback even thread-even depth-1" id="comment-6644">
          <div class="comment-body">
           Pingback：
           <a class="url" href="http://cos.name/2015/03/statistics-in-chinese-song-poem-3/" rel="external nofollow">
            WeiTaiyun: 统计词话（三） | 统计之都 (中国统计学门户网站，免费统计学服务平台)
           </a>
          </div>
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-odd thread-alt depth-1" id="comment-7138">
          <article class="comment-body" id="div-comment-7138">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/a5cca5361980c581f8effaeea7ea352c?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              张旗
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#comment-7138">
              <time datetime="2016-04-07T13:52:15+00:00">
               2016/04/07 13:52
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             我按照你说的在R中重新验证了下，R提示指令错误，不知为何
             <br/>
             splitwords=function(x,x.len) substring(x,1:(x.len-1),2:x.len);
             <br/>
             &gt; words=mapply(splitwords,sentences,s.len,SIMPLIFY=TRUE,USE.NAMES=FALSE);
             <br/>
             Error in mapply(splitwords, sentences, s.len, SIMPLIFY = TRUE, USE.NAMES = FALSE) :
             <br/>
             object ‘sentences’ not found
             <br/>
             &gt; words=unlist(words);
             <br/>
             Error in unlist(words) : object ‘words’ not found
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给张旗" class="comment-reply-link" href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/?replytocom=7138#respond" onclick='return addComment.moveForm( "div-comment-7138", "7138", "respond", "3194" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
        </ol>
        <!-- .comment-list -->
        <div class="comment-respond" id="respond">
         <h3 class="comment-reply-title" id="reply-title">
          发表评论
          <small>
           <a href="http://cos.name/2011/03/statistics-in-chinese-song-poem-1/#respond" id="cancel-comment-reply-link" rel="nofollow" style="display:none;">
            取消回复
           </a>
          </small>
         </h3>
         <form action="http://cos.name/wp-comments-post.php" class="comment-form" id="commentform" method="post" novalidate="">
          <p class="comment-notes">
           <span id="email-notes">
            电子邮件地址不会被公开。
           </span>
           必填项已用
           <span class="required">
            *
           </span>
           标注
          </p>
          <p class="comment-form-comment">
           <label for="comment">
            评论
           </label>
           <textarea aria-required="true" cols="45" id="comment" maxlength="65525" name="comment" required="required" rows="8">
           </textarea>
          </p>
          <p class="comment-form-author">
           <label for="author">
            姓名
            <span class="required">
             *
            </span>
           </label>
          </p>
          <p class="comment-form-email">
           <label for="email">
            电子邮件
            <span class="required">
             *
            </span>
           </label>
          </p>
          <p class="comment-form-url">
           <label for="url">
            站点
           </label>
          </p>
          <p class="form-submit">
          </p>
          <p style="display: none;">
          </p>
          <p style="display: none;">
          </p>
         </form>
        </div>
        <!-- #respond -->
       </div>
       <!-- #comments -->
      </div>
      <!-- #content -->
     </div>
     <!-- #primary -->
     <div class="sidebar-container" id="tertiary" role="complementary">
      <div class="sidebar-inner">
       <div class="widget-area">
        <aside class="widget widget_text" id="text-3">
         <h3 class="widget-title">
          关注统计之都
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            新浪微博
            <a href="http://weibo.com/cosname">
             @统计之都
            </a>
           </li>
           <li>
            人人网
            <a href="http://renren.com/cosname">
             @统计之都
            </a>
           </li>
           <li>
            Twitter
            <a href="http://twitter.com/cos_name">
             @cos_name
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-6">
         <h3 class="widget-title">
          微信公众平台
         </h3>
         <div class="textwidget">
          <img src="http://cos.name/wp-content/uploads/2013/04/qrcode-8cm.jpg"/>
          <p style="font-size:12px;margin-left:15px">
           微信号 CapStat
          </p>
          <p>
           我们将第一时间向您推送主站和论坛的精彩内容，以及统计之都的线下活动、竞赛、培训和会议信息。
          </p>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-8">
         <h3 class="widget-title">
          站内导航
         </h3>
         <div class="textwidget">
          <ul>
           <li class="page_item">
            <a href="http://cos.name/cn/">
             中文论坛
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/videos/">
             视频
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/salon/">
             统计沙龙
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/books/">
             图书出版
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/training/">
             教育培训
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/about/">
             关于我们
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/donate/">
             捐赠
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/chinar/">
             R语言会议
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_links" id="linkcat-2">
         <h3 class="widget-title">
          友情链接
         </h3>
         <ul class="xoxo blogroll">
          <li>
           <a href="http://stat.ruc.edu.cn" target="_blank" title="中国人民大学统计学院网站">
            中国人民大学统计学院
           </a>
          </li>
          <li>
           <a href="http://rucdmc.net">
            中国人民大学数据挖掘中心
           </a>
          </li>
          <li>
           <a href="http://birc.gsm.pku.edu.cn/" target="_blank">
            北京大学商务智能研究中心
           </a>
          </li>
          <li>
           <a href="http://sam.cufe.edu.cn/" target="_blank" title="中央财经大学统计与数学学院网站">
            中央财经大学统计与数学学院
           </a>
          </li>
          <li>
           <a href="http://tjx.cueb.edu.cn/" target="_blank" title="首都经济贸易大学统计学院网站">
            首经贸统计学院
           </a>
          </li>
          <li>
           <a href="http://www.shookr.com/">
            数客网大数据社区
           </a>
          </li>
          <li>
           <a href="http://www.xueqing.tv/" target="_blank" title="数据科学在线学习平台">
            雪晴数据网
           </a>
          </li>
          <li>
           <a href="http://iera.name/" target="_blank" title="IERA是一个旨在普及、传播和增进工业工程知识的非营利性网站">
            IERA（直通IE）
           </a>
          </li>
         </ul>
        </aside>
        <aside class="widget widget_categories" id="categories-2">
         <h3 class="widget-title">
          全部分类
         </h3>
         <label class="screen-reader-text" for="cat">
          全部分类
         </label>
         <select class="postform" id="cat" name="cat">
          <option value="-1">
           选择分类目录
          </option>
          <option class="level-0" value="925">
           cos访谈  (4)
          </option>
          <option class="level-0" value="659">
           图书出版  (5)
          </option>
          <option class="level-0" value="379">
           数学方法  (14)
          </option>
          <option class="level-1" value="381">
           分析与代数  (1)
          </option>
          <option class="level-1" value="380">
           概率论  (9)
          </option>
          <option class="level-1" value="382">
           随机过程  (5)
          </option>
          <option class="level-0" value="210">
           数据分析  (81)
          </option>
          <option class="level-1" value="203">
           多元统计  (3)
          </option>
          <option class="level-1" value="42">
           数据挖掘与机器学习  (42)
          </option>
          <option class="level-1" value="36">
           生物与医学统计  (17)
          </option>
          <option class="level-1" value="35">
           计量经济学  (4)
          </option>
          <option class="level-1" value="296">
           金融统计  (3)
          </option>
          <option class="level-1" value="303">
           风险精算  (7)
          </option>
          <option class="level-0" value="177">
           模型专题  (15)
          </option>
          <option class="level-1" value="38">
           回归分析  (10)
          </option>
          <option class="level-1" value="41">
           时间序列  (2)
          </option>
          <option class="level-0" value="784">
           每周精选  (24)
          </option>
          <option class="level-1" value="183">
           可视化  (9)
          </option>
          <option class="level-0" value="967">
           沙龙纪要  (3)
          </option>
          <option class="level-0" value="18">
           经典理论  (46)
          </option>
          <option class="level-1" value="37">
           抽样调查  (3)
          </option>
          <option class="level-1" value="4">
           统计推断  (26)
          </option>
          <option class="level-1" value="236">
           试验设计  (7)
          </option>
          <option class="level-1" value="39">
           非参数统计  (3)
          </option>
          <option class="level-0" value="1">
           统计之都  (279)
          </option>
          <option class="level-1" value="884">
           中国R会议  (2)
          </option>
          <option class="level-1" value="885">
           中国R语言会议  (5)
          </option>
          <option class="level-1" value="446">
           出国留学  (3)
          </option>
          <option class="level-1" value="179">
           推荐文章  (90)
          </option>
          <option class="level-1" value="3">
           新闻通知  (75)
          </option>
          <option class="level-1" value="263">
           统计刊物  (10)
          </option>
          <option class="level-1" value="174">
           网站导读  (40)
          </option>
          <option class="level-1" value="204">
           职业事业  (51)
          </option>
          <option class="level-1" value="213">
           高校课堂  (9)
          </option>
          <option class="level-0" value="178">
           统计计算  (28)
          </option>
          <option class="level-1" value="40">
           优化与模拟  (15)
          </option>
          <option class="level-1" value="43">
           贝叶斯方法  (6)
          </option>
          <option class="level-0" value="378">
           软件应用  (116)
          </option>
          <option class="level-1" value="44">
           统计图形  (36)
          </option>
          <option class="level-1" value="110">
           统计软件  (83)
          </option>
         </select>
        </aside>
        <aside class="widget widget_recent_comments" id="recent-comments-2">
         <h3 class="widget-title">
          最新评论
         </h3>
         <ul id="recentcomments">
          <li class="recentcomments">
           <span class="comment-author-link">
            fineboom
           </span>
           发表在《
           <a href="http://cos.name/2016/06/use-shiny-fleetly-set-up-visual-prototype-system/#comment-7317">
            利用shiny包快速搭建可视化原型系统
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            胡家新
           </span>
           发表在《
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7316">
            R语千寻第三期：张无忌究竟爱谁？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            <a class="url" href="http://www.zijiacha.com/category.php?id=6" rel="external nofollow">
             南糯山普洱茶
            </a>
           </span>
           发表在《
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7315">
            R语千寻第三期：张无忌究竟爱谁？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            J
           </span>
           发表在《
           <a href="http://cos.name/2016/05/value-of-the-reputation-from-the-data/#comment-7314">
            数据告诉你：高信誉的卖家应该收高价，还是收低价？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            <a class="url" href="http://gg" rel="external nofollow">
             Hilda
            </a>
           </span>
           发表在《
           <a href="http://cos.name/2013/01/drawing-map-in-r-era/#comment-7311">
            R时代，你要怎样画地图？
           </a>
           》
          </li>
         </ul>
        </aside>
        <aside class="widget widget_rss" id="rss-282869971">
         <h3 class="widget-title">
          <a class="rsswidget" href="http://cos.name/cn/topics/feed/">
           <img src="http://cos.name/wp-includes/images/rss.png"/>
          </a>
          <a class="rsswidget" href="http://cos.name/cn/topics/feed/">
           中文论坛新帖
          </a>
         </h3>
         <ul>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/417372/">
            处理时间数据和产生时间序列的问题
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/6790/">
            《统计陷阱》下载 （How to lie with statistics）
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/818/">
            统计学的世界（第五版）
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/16574/">
            class(x) 返回值值是AsIs,AsIs代表什么，有什么用处？
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/417366/">
            如何用R绘制一个分类算法的决策规则
           </a>
          </li>
         </ul>
        </aside>
        <aside class="widget widget_text" id="text-2">
         <h3 class="widget-title">
          登录/RSS
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            <a href="http://cos.name/wp-admin/">
             登录
            </a>
           </li>
           <li>
            <a href="http://cos.name/feed/" title="使用 RSS 2.0 同步站点内容">
             文章
             <abbr title="Really Simple Syndication">
              RSS
             </abbr>
            </a>
           </li>
           <li>
            <a href="http://cos.name/comments/feed/" title="RSS 上的最近评论">
             评论
             <abbr title="Really Simple Syndication">
              RSS
             </abbr>
            </a>
           </li>
          </ul>
         </div>
        </aside>
       </div>
       <!-- .widget-area -->
      </div>
      <!-- .sidebar-inner -->
     </div>
     <!-- #tertiary -->
    </div>
    <!-- #main -->
    <footer class="site-footer" id="colophon" role="contentinfo">
     <div class="site-info">
      版权所有 © 2014 统计之都 | 由
      <a href="http://wordpress.org/">
       WordPress
      </a>
      构建 | 主题修改自
      <a href="http://wordpress.org/themes/twentythirteen">
       Twenty Thirteen
      </a>
     </div>
     <!-- .site-info -->
    </footer>
    <!-- #colophon -->
   </div>
   <!-- #page -->
   <p style="margin:0;padding:0;height:1px;overflow:hidden;">
    <a href="http://www.wumii.com/widget/relatedItems" style="border:0;">
     <img src="http://static.wumii.cn/images/pixel.png"/>
    </a>
   </p>
  </div>
 </body>
</html>